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1. Dans un mémoire récent Mrs. J. Neyman et E. S. Pe- 
arson proposent une méthode générale!) de vérification des hy- 
pothèses statistiques. 

Ayant donné un fait observè F et une hypothèse statistique 
H, on calcule ce qu'on appelle la vraisemblance de cette hypothèse 
An. Si 2, est petite, par ex. si 4, < À, on convient de conclure 
que l’hypothèse est probablement fausse. Si au contraire À, < 4;, on 
admet qu'on n’a pas de raison suffisante pour une conclusion pa- 
reille. Le nombre À, doit être choisi de manière que le danger de 
rejection d’une hypothèse vraie ne soit pas trop grand. Ce danger 
est mesuré par P,— la valeur de la probabilité pour qu’on ait 
Ån S ĉo, déterminée par l'hypothèse considérée H, ou la borne su- 
périeure de cette probabilité, si celle ci n’est pas déterminée par H. 
Il est évident d’ailleurs, que si l'on rejette l'hypothèse H lorsque 
Åu S Žo, la probabilité x pour qu'on rejette une hypothèse vraie 
ne surpasse pas P,. Or, si À, est choisi de telle façon que P = e, 
€ étant un nombre arbitraire entre zèro et un, et qu’on accepte la 
règle de rejeter l'hypothèse H lorsque 2, << À, et de l’accepter dans 
les autres cas, on peut être sur qu’une hypothèse vraie sera rejetée 
avec une fréquence moyenne, qui ne surpasse pas €. 


1) J. Neyman and E. S. Pearson: On the Use and Interpretation 
of Certain Test Criteria for Purposes of Statistical Inference. Biometrika Vol. 
XX—A. P. 175—240 et 264—294. 
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Le point essentiel dans la méthode de Mrs. J. Neyman et 
E. S. Pearson consiste dans le principe que le degré de notre con- 
fiance en une hypothèse statistique H peut être mesuré par la va- 
leur de la vraisemblance 2,. Evidemment ce principe peut être 
admis ou rejeté, selon qu’il semble intuitif ou non. De ce point de 
vue il est intéressant que toutes les méteodes de vérification des 
hypothèses, qui sont entrées en usage général et qui ont été exa- 
minées !), sont des conséquences du principe mentionné. 

Le but de la note présente est de démontrer, que la méthode 
bien connue de Lexis-Bortkiewicz de vérification de lhypo- 
thèse sur la constance des probabilités dans plusieurs séries des 
épreuves indépendantes est — elle aussi — une conséquence du 
principe des Mrs. J. Neyman et E. S. Pearson?). 

2. Rappelons la terminologie. Soit F un fait, déterminé par 
les coordonnées 
(1) EAN R 
qui peuvent varier dans certaines limites, et À — une hypothèse 
concernant F. Si 4 détermine la probabilité (sensu stricto, ou la 
probabilité élémentaire) de F, nous dirons, que k est une hypothèse 
statistique simple. Toute hypothèse H, qui n’est pas simple est dite 
composée. Il est évident que l'hypothèse composée H peut être 
transformée en une hypothèse simple. Il suffit pour celà d’adjoindre 
à H arbitrairemeut quelques suppositions supplémentaires pour que 
l’ensemble de ces suppositions détermine la probabilité de F. Si h 
est une hypothèse simple, qui peut être obtenue de H par ce pro- 
cédé, nous dirons, que À appartient à H. 

Soit Q l'ensemble des hypothèses simples qu’on considère 
dans un cas donné comme admissibles. Soit A une de ces hypo- 


1) J. Neyman and E. S. Pearson: On the Use and Interpretation... 
Loc. cit. 

J. Neyman and E. S. Pearson: On the Problem of Two Samples. 
Bull. de l'Académie Polonaise des Sciences et des Lettres. A, 1930, p: 73—96. 

J. Neyman: Contribution to the Theory of Certain Test Criteria. Bull. 
de l’Institut International de Statistique, 1929. P. 44—88. 

J. Neyman: Sur la limite de la vraisemblance de l'hypothèse. C. R., 
t. 188, p. 1260. 

J. Neyman: Sur une méthode de vérification des hypothèses. Ibidem 
p. 1467. 

1) Ce problème m'a été posé par Mr. J. Neyman, à qui je dois aussi 
quelques indications sur la méthode. 
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thèses ét P,, — la probabilité (sensu stricto ou la probabilité élé- 
mentaire) de F, déterminée par h. Nous allons supposer que Pen- 
semble des valeurs de P,-, qui correspondent à un même fait F' 
est borné, quel que soit F. Soit P, la borne supérieure de P, par 
rapport a l’ensemble Q et pour un fait fixé F. 

Si l’on a observé F, on appelle la vraisemblance de l’hypo- 
thèse simple 4 le rapport 

Ppr 

(2) n= P 


Si H est une hypothèse composée, pour définir la vraisem- 
blance de H lorsqwon a observé F, on considère le sousensemble 
Q, des hypothèses simples qui appartiennent à H. Soit Hyr la borne 
supérieure des nombres P,- par rapport à l'ensemble Q, et le 
fait F. La vraisemblance 2, de H est alors 


pe 


(3) An = pe 


3. Le problème, que nous allons considérer, peut être précisé 
comme suit, 

Nous considérons les épreuves indépendantes qui peuvent don- 
ner lieu à un des deux événements: Æ ou sa négation Æ. Ces 
épreuves sont effectuées en s séries et soit n; le nombre des épreu- 
ves, qui appartiennent à l’i-ème série (i = 1, 2,...s). Supposons qu'on 
sait, que la probabilité de Æ dans les épreuves appartenant à une 
même série est constante. Soit p; la valeur de cette probabilité qui 
correspond à l'i-ème série des épreuves. 

Le fait observé F' consiste dans les nombres k; des épreuves 
de l’i-ème série, qui ont donné lieu à l'événement E, pour i—1,2...s. 

L'hypothèse H, qu’on doit vérifier, affirme que 


(4) Pi = Pa =. = P 
c'est-à-dire que la probabilité de l'événement Æ était la même dans 
toutes les séries des épreuves. Désignons par p la valeur de cette 
probabilité. Il est à remarquer, que p n’est pas déterminée par l’hy- 
pothèse H, qui par conséquent est une hypothèse composée. 

Nous allons vérifier cette hypothèse par rapport à l’ensemble 
Q des hypothèses admisibles, qui renferme toute hypothèse % pré- 
cisant les valeurs des probabilités p; quelconques o < p,< 1 pour 
4 1,2,...8 
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4. La probabilité du fait observé F déterminée par une hy- 
pothèse h est 


(5) Fiy — F / aA a p)" # 


i=l 


La valeur maximum de P,- est égale à 


(6) P, = f/i Ong — q)" 
i=l 

où 

(1) =i 


La probabilité du fait F, déterminée par une hypothèse simple 
qui appartient à H est égale à 


(8) Par = p(1 — p Il Chi 
iml 
où 
(9) ko = Sh: no = dr. 
=] i=l 


Posons encore 
(10) dem 


Alors le maximum de Pyp sera 


(11) Pur = U — go) FI Ch: 


i=l 
et la vraisemblance 4, de l'hypothèse H 
Sr ko 
(12) se A Un 7 ABS 
Lg — q)" 
1=1 


La formule (12) présente la solution de la première partie du 
problème. Pour la compléter il faudrait considérer la probabilité 


(13) Pilu < ho} 
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pour qu’on ait Ay S< À, À étant un nombre positif quelconque. En 
cas où cette probabilité serait déterminée par l'hypothèse H, c'est- 
à-dire si elle était indépendante de la valeur commune p des pro- 
babilités de l’évenement Æ dans toutes les s séries des épreuves, 
qui n’est pas déterminée par H, la solution serait complétée par le 
calcul de (13). Si au contraire P{1, < 2} n'était pas déterminée 
par H, il serait nécessaire de calculer la borne supérieure de 
P{ln S lo}. 
Evidemment 


(14) Pin < ho} = 2 IL cv Se 
i=l 
où la somme X s'étend sur tous les systèmes des valeurs des nombres 
k; pour lesquels 
(15) ok, LA, = a na) 


AOE 


(16) n= pa gp Se 


Le calcul de la somme (14) semble inabordable et nous nous 
bornerons au calcul de sa limite, lorsque (a) le nombre n, des 
épreuves effectuées croît indéfiniment de telle manière que 


(17) n; > Vh 
v étant un nombre positif fixe. Nous supposerons de plus que (b) 
(18) o<p<l, 


ce qui est d’ailleurs évidemment une limitation sans importance. 
Désignons par I(A) l'intégrale 


Pm Èn p) 

N; 

(19) I = — 2 ane f.. Je ETEN) de dg … 
(2x pli — p)? 


étendue sur un domaine A dans l’espace à s dimensions, et où 
Qu» q2; --- Qs désignent les variables continues. Considérons 4, comme 
une fonction de ces variables et désignons par W, le domaine dé- 
fini par l'inégalité 


(20) în > À. 
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Si les conditions (a) et (b) sont remplies, et si le nombre m, 
est assez grand, on peut appliquer le théorème de Laplace et écrire 


(21) PA > lo} =I( Wo) + 7. 


|ņ| étant si petit que l’on veut, Fixons un nombre positif arbitraire 
e et choisissons N assez grand pour qu'on aît |ņ|< £, lorsque 
no > À. 

Vu les propriétes connues de la fonction sous le signe de 
l'intégrale (19) on peut trouver un tel nombre positif y, que 


žy 


i=l 


Es SEE 
(22) m=) Sf E E dy, > 1 — 8 
A 


où W, désigne le domaine défini par l'inégalité 


SOR 
pair <% 


mi PA —p) 


et W; est la transformation de W, par les formules 


(24) u= pts E2 RP, E 


Remarquons que le domaine W;, et par conséquent l'intégrale 
I(W,), sont indépendants de n; (i= 1,2,...,s). 


Considérons W, — la partie commune des domaines W, et 
W,. Il est aisé de voir que 
(25) Pin > bo} = I( W3) + M 


où || < 2e, lorsque 
(26) ñ > N. 
Les raisonnements qui suivent ont pour but de trouver deux 
domaines W, et W, tels que 
(27) WEE Fi C W 


et que les intégrales Z(W,) et 1(W;) tendent vers une même limite 
ł — P,, lorsque n, — co. Il est clair qu'alors le même nombre sera 
aussi la limite de la probabilité P{4, > 2,}. 

Rocznik Pol. Tow. Matem, T. IX, 5 
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Dans tout point du domaine W, on a 


2oVp(1 — p) _ zo |/pQ — ») 
(28) lg — p| S Vn, <e = 
(29) Jo — pi <y ea — r) 
Zo (w + 1)Ÿp(1 — p) 
(30) iure Tr mn 1e 
Posons 
(31) aa +a 2E q) 


Si le nombre N est assez grand il résulte de (26) et (29) qu'il 
existe un nombre positif œ < 4 tel que 


(32) a<<1—a 
done que 

a qo l— a 
(33) SPAS E 
et 

a 1— g _1—a 
(34) Tar a ipe 


Supposons que N est assez grand et fixons æ satisfaisant (32), 
Il résulte alors de (30), (33) et (34) que les variables æ; (i =1,2,... s) 
sont bornées dans leur ensemble et p. ex. que |+|<< M pour 
i= 1, 2,...s. Un calcul simple donne alors 


— log À; Nr m (20 + x PE) fie as 


= nf: — Qo TEEN É E A 
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lo Jo 1 zi do 8/; 
U Ti wo ei eV)" TETY 
; n;i(1 — qo) 
(35) =; +m, 0< 9, 6; <1 


t=1 


où || < 5 dans tout point du domaine W, pourvu que N soit 


assez grand et l'inégalité (26) — satisfaite. 
Posons 


(36) Q=—2194 
et considérons deux domaines W, et W, définis par des inégalités 


w o-ÿja-jitica 
(88) 2 jar GE 2 
et 

(39) Q@< A+ e 

(40) L< Ho 
respectivement. Il est clair que 

(41) LA SLA M 

et par conséquent 

(42) IW) <S IW) < IW). 


Observons que les inégalités (37) et (39) sont équivalentes à 


w fenya- 


et 


PB ep- 


5* 
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respéctivement. À cause de (29) et au moyen de l’augmentation éven- 
tuelle du nombre N on peut satisfaire les inégalités : 


M) B>A (1+) RE) o — 2 
et 


Go). A< +h +) E) <o+2e. 


Désignons par W; et W les domaines définis par les iné- 
galités 


(qi — Qo)°n: di 
(47) DE UD en 2e 
(48) << 
et 
(49) Fere T T 
(50) PÉ 


respectivement. Il est clair que si N est assez grand, on a pour 
tout n, > N 


61) MCR CR CPE 
et par conséquent 
(52) IW) < (W3) < I(W.). 


Pour calculer les limites des intégrales I(W;) et I(W4), con- 
sidérons les domaines, soit W, et W, qui correspondent aux iné- 
galités (47) et (49) respectivement. A cause des propriétés du nombre 
Xo nous aurons 


(53) IW) = I(W;) + n 
(54) IW) +1(W.) + %s 
ù OKE et OKM <E. 


L intégrales I( W,) et Z(W;) sont des cas particuliers de 
l'intégrale Z(W,) prise dans le domaine W,, où l’on a 


g?) 
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eS 3 Ta =i F3 "ie 


Le calcul de l'intégrale Z(W,) ne présente aucune difficulté, 
La transformation (24) donne immédiatement 


(66) wija A $ 1p f 42r dhd dy, 


où l'intégration s'étend à un domaine, où l’on a 


s 


67) >E = ( 2 wi) <o 


i=l 


Or la valeur de (56) est connue, savoir 


(58) (W) = of pae ge 
0 

où 

(69) = f se lg. 


En combinant les résultats (25), (48), (51), (52) et (58), on 
peut écrire 


Vox Vore 


(60) of ee qi m — mS Pln >AS (A Lo dt, 


d'où on conclut que 


(61) lim P{4,> 4} = o fime -4t y 
y —> 00 
donc que 
(62) lim PA, < 2o) = 0 [te lu Py, 
Qo 


ce qu’il fallait démontrer. Il est à remarquer, que la limite de la 
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probabilité P{1,<2,} est parfaitement déterminée par l’hypo- 
thèse H. 

Si le nombre des épreuves effectuées n, est très grand, léga- 
lité (62) permet de mesurer la probabilité P{4,< ĉo} par la valeur 
de sa limite P,. 

La téchnique de la vérification de l’hypothèse H sur la con- 
stance de la probabilité pendant s séries des épreuves indépendantes 
consiste dans le calcul du nombre 


(63) Q, = — 2 lgåy. 
Si ce nombre est grand, on conclut que la vraisemblance de 


l'hypothèse Æ est petite et on hésite d'accepter Æ. On considère 
ensuite les tables !) de l'intégrale (62) et on y trouve la valeur de 


(64) Pu =C fre ta 
QH 
Si Py est jugé petit, on n’hésite plus de rejeter H, vu que la 
probabilité pour qwon rejette une hypothèse vraie, est dans ce cas 
plus petite que Py. 
Pour le calcul de Q, on peut s'adresser à la formule 


a, = a E Vaa 


65 s 
( ) Hga 2% qi) 


ou à la formule approchée 


i g Z (q — q)’ 
ai ET 

On voit sans peine que cette dernière formule est en conne- 
xion simple avec le coefficient de dispersion D introduit pour la 
vérification de l'hypothèse H par Lexis et étudié par M. L. v. 
Bortkiewicz, savoir 
(67) Qu—(s—1)D?. 

On sait que si D est sensiblement plus grand que l'unité, 
d’après la méthode de Lexis il faudrait rejeter H. Le verdict se- 
rait le même si l’on partait du principe général des Mrs. J. Ney- 


1) Karl Pearson: Tables for Statisticians and Biometricians. Cam- 
bridge, 1924. 
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man et E. S. Pearson. Ainsi dans le cas où l'on sait que la pro- 
babilité de l'événement Æ était constante pendant chaque série des 
épreuves, la méthode classique de la vérification de l'hypothèse H 
est une conséquence du principe mentionné. 

Il est à remarquer que la circonstance que la loi de proba- 
bilité élémentaire de l'expression 


NEC — go)” 
(68) y lo (1 — 40) 


peut être représentée approximativement par la fonction 


(69) Oze 32 


est connue 1). Au contraire le résultat (62) semble être nouveau. 


1) Voir p. ex. R. A. Fisher: Statistical Methods for Research Wor- 
kers. Oliver and Boyd. 1925. 
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